import pandas as pd
import os

# /Users/yanjunhua/Desktop/songjian_sale_data_v3.csv


'''
@param src_file  销售数据文件，csv格式，列为  '商品编码','日期','销售数量','销售额'
@param dst_dir   存放的目录，文件以商品编码为文件名
'''


def split_raw_sale_data(src_file, dst_dir):
    if not os.path.exists(src_file):
        print('sale file %s not exist.' % src_file)
        return
    if not os.path.exists(dst_dir):
        os.makedirs(dst_dir)

    sale_data_raw = pd.read_csv(src_file, dtype={'商品编码': str})
    sale_data_raw.columns = ['商品编码', '日期', '销售数量', '销售额']
    grouped = sale_data_raw.groupby('商品编码')

    for name, group in grouped:
        group.to_csv(dst_dir + '/%s.csv' % name, index=False)
